细粒度评估

首页

细粒度评估

列表

默认

浏览次数

发布日期

GTA

GTA是一项由上海交通大学与上海AI实验室合作研发的基准测试，专注于评估大型语言模型在真实世界环境中的工具调用能力。它包含229个精心设计的问题，涉及多个领域，并通过多模态输入输出和细粒度评估指标，全面衡量模型的工具使用效率与准确性。GTA可应用于智能助理开发、多模态交互、自动化客户服务、教育及科研等多个领域，助力提升人工智能系统的综合性能。

AI项目与工具 2025年06月12日 20 点赞 0 评论 844 浏览

细粒度评估 首页 细粒度评估

列表 默认 浏览次数 发布日期

GTA

细粒度评估

首页

细粒度评估

列表

默认

浏览次数

发布日期